elpis

【AI大模型展】天云数据Elpis——强化学习后训练国产信创大模型

天云数据Elpis VR是基于高效低成本数据合成技术、可验证强化学习的领域增强、多策略偏好调优,通过全流程自动化分布式训练构建的强化学习后训练国产信创大语言模型,具备即插即用和快速微调的能力,通过强化学习融合了人类高阶知识,通过数据合成降低整体训练成本。

训练 模型 学习 天云 elpis 2025-08-22 08:12  2